Auto Research最后一块拼图,Frontier-Eng Bench登场,在工程闭环里死磕最优
Auto Research最后一块拼图,Frontier-Eng Bench登场,在工程闭环里死磕最优科研,能被 AI 全程加速吗?
搜索
科研,能被 AI 全程加速吗?
这两天,最火的新闻就是美国战争部(五角大楼)把过去几十年的 UFO 档案全部「开源」了。
最近看了一个 AI 工具站:undetectable.ai。
以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型,通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而,这些模型普遍存在一个核心问题,即过度思考(overthinking) :
随着语音、视频、多模态能力不断融入大语言模型(LLM),人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具,也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。
大家好,我是袋鼠帝。 过去这一两年,AI 圈可谓是神仙打架,各种新概念、新模型、新应用天天刷屏。
王珏 (左)方晨(右) 推荐语 动画是一个被低估的品类。它比真人影视更早拥抱数字化工具,比短视频承载更复杂的叙事,从迪士尼到吉卜力,证明了自己能撑起全年龄段的内容消费和完整的商业闭环。但动画的产能瓶颈
Mira Murati 用一年半时间证明了「人机协作」不是一句口号。 5 月 11 日,Thinking Machines Lab 发布了一段研究预览视频,展示了他们所谓的「交互模型」(Interaction Model)。
今天,OpenAI 正式揭晓了 DeployCo:OpenAI 部署公司
布雷特·泰勒创立的 AI 初创公司 Sierra 正在完成一轮由 Tiger Global 和 GV 领投的 9.5 亿美元融资,该公司周一宣布 ,其投后估值已突破 150 亿美元。这笔融资使 Sierra 可动用的资金超过 10 亿美元——该公司表示将利用这笔资金成为 AI 驱动客户体验的"全球标准"。